Boosting d’un pool d’apprenants faibles

نویسندگان

  • Henri-Maxime Suchier
  • Jean-Christophe Janodet
  • Christine Largeron
  • Marc Sebban
چکیده

Nous considérons ici des problèmes d’apprentissage où les données sont présentées à l’aide de caractéristiques fortement hétérogènes, par exemple, une base de personnes où chaque individu est décrit par son nom (une chaı̂ne de caractères), sa photo (une image), un enregistrement de sa voix (du son) et ses mensurations (des réels). Il n’existe aucun algorithme capable d’apprendre en travaillant sur toutes ces caractéristiques à la fois (sauf en utilisant un codage et donc en perdant de l’information), mais nous disposons d’algorithmes performants et spécialisés pour traiter efficacement chaque type de caractéristiques. Dans ce travail, nous proposons une nouvelle procédure de boosting, k-BOOST, permettant à ces algorithmes de collaborer activement pendant la phase d’apprentissage, et de construire ainsi une hypothèse globale très performante. Nous étudions les propriétés théoriques de k-BOOST puis nous menons des expérimentations prouvant que notre méthode fonctionne significativement mieux que toute autre combinaison d’hypothèses qui seraient construites sans collaboration. Mots-clés : Boosting, variables hétérogènes, résultats de convergence.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Détection de groupes atypiques pour une variable cible quantitative

Résumé. Une tâche importante en analyse des données est la compréhension de comportements inattendus ou atypiques de groupes d’individus. Quelles sont les catégories d’individus qui gagnent de particulièrement forts salaires ou au contraire, quelles sont celles qui ont de très faibles salaires ? Nous présentons le problème d’extraction de tels groupes atypiques vis-à-vis d’une variable cible qu...

متن کامل

Sous-bases k-faibles pour des règles d'association valides au sens de la confiance

L’un des problèmes majeurs rencontrés dans la fouille des règles d’association valides au sens de la confiance est le nombre souvent très élevé de ces règles. Plusieurs solutions à ce problème ont été proposées ou considérées dans la littérature. Parmi ces solutions figurent les bases, c’est-à-dire, des familles génératrices minimales (Zaki et Ogihara, 1998; Pasquier et al., 1999). La plupart d...

متن کامل

Adaptation du boosting à l'inférence grammaticale via l'utilisation d'un oracle de confiance

Résumé : Cet article présente une adaptation du boosting à l’inférence grammaticale. Notre but est d’améliorer les performances d’un algorithme à base de fusion d’états, en présence de données bruitées. Notre algorithme de boosting utilise une nouvelle règle de mise à jour des poids qui tient compte d’une information supplémentaire fournie par un oracle. Cette information est une évaluation de ...

متن کامل

Générer des règles de classification par dopage de concepts formels

Résumé. La classification supervisée est une tâche de fouille de données (Data Mining), qui consiste à construire un classifieur à partir d’un ensemble d’exemples étiquetés par des classes (phase d’apprentissage) et ensuite prédire les classes des nouveaux exemples avec ce classifieur (phase de classification). En classification supervisée, plusieurs approches ont été proposées dont l’approche ...

متن کامل

Inverse impedance boundary problem via the conformal mapping method: the case of small impedances

RÉSUMÉ. Haddar and Kress [9] ont étendu l’utilisation de la méthode des applications conformes [2, 8] pour construire le bord intérieur Γi d’un domaine doublement connexe à partir de données de Cauchy sur le bord extérieur d’une fonction harmonique qui satisfait une condition homogène d’impédance sur Γi. Cependant, l’analyse de la méthode montre la non-convergence de l’algorithme proposé dans [...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2007